查看原文
其他

正念爱好者的 twitter 语言风格有何不同?

大邓 大邓和他的Python
2024-09-09

在《逻辑哲学论》中,维特根斯坦(1961)著名地写道:我的语言的限制意味着我的世界的限制(The limits of my language mean the limits of my world!”(第23页)。作为表达思想和感情的符号系统,语言和词语揭示了我们的重要信息。我们如何表达自己反映了我们是谁,我们如何感受,我们如何处理信息以及我们关心什么。例如,经历积极情绪的人使用更多的积极情感词汇和感叹号(Hancock等人,2007),而那些处于痛苦中的人则倾向于关注自己并使用更多的第一人称单数代词(Rude等人,2004)。因此,语言和词语的研究可以帮助理解人类心理。

摘要

这项研究旨在探究在Twitter上对正念(mindfulness)感兴趣的人们是否在他们的推文中使用了与其他人不同的语言。将用户分为正念组和非正念组,含19732位推特用户的1873万条推文。作者使用LIWC(Linguistic Inquiry and Word Count, LIWC)来查看推文中与正念、情感过程、社交取向和“存在模式”相关的语言标记。研究发现,对正念感兴趣的人在Twitter上更频繁地使用与正念、积极情感、幸福和社交取向相关的语言标记,并且使用与消极情感、过去、现在和未来焦点、家庭和友谊取向相关的标记更少。这表明,推特上对正念感兴趣的人使用了特定的语言标记,这可以为开发更自然的评估正念的方法提供可能的途径。


数据

19732位推特用户的1873万条推文。构建研究数据的方法

  • 正念爱好组数据
    • 找正念的大V,获取大V的粉丝列表fans_list
    • twitter api每15分有900次访问权限,最终获得 10,347 粉丝的个人数据
  • 控制组用户数据,从数Kaggle
    公开的Sentiment140数据集随机抽取9385位用户的数据

分析

作者主要比较了正念爱好者、非正念爱好者,两组群体推特以下  5 个角度测量语言风格,测试是否正念与语言风格是否有显著性(0.001的显著性水平)

  • 正念 ,例如:curious、open、accepting。

  • 情感过程   happy, sadly, yay

    • 快乐,例如:nice、nasty。
    • 积极情绪,例如:sweet。
    • 消极情绪,例如:hurt、ugly。
  • 社交定向   interact, talk, everyone

    • 朋友定向,例如:buddy、neighbour
    • 家庭定向,例如:daugher、dad、aunt
  • 思维模式 does had will

    • 聚焦于现在,例如:I'm, now, use
    • 聚焦于过去,例如:were、walked, had。
    • 聚焦于将来,例如:will, going to
  • 时间 例如:since、wait、clock。

对正念感兴趣的人在Twitter上更频繁地使用与正念、积极情感、幸福和社交取向相关的语言标记,并且使用与消极情感、过去、现在和未来焦点、家庭和友谊取向相关的标记更少。

关于LIWC

LIWC(Linguistic Inquiry and Word Count, LIWC),其实就是词典法文本分析,统计文本中体现构念信息的相关词语出现次数多寡或频繁的程度。之前分享过 LIWC vs Python  | 文本分析之词典词频法略讲(含代码) ,感兴趣可以阅读一下, 更好的了解 LIWC 和 Python 。




精选文章

管理世界 | 使用文本分析词构建并测量短视主义

管理世界 | 使用 经营讨论与分析 测量 企业数字化指标

管理世界 | 用正则表达式、文本向量化、线性回归算法从md&a数据中计算 「企业融资约束指标

可视化 | 词嵌入模型用于计算社科领域刻板印象等信息(含代码)

可视化 | 绘制《三体》人物关系网络图

可视化 | 使用决策树分析小红书帖子数据(含代码)

转载 | 基于词嵌入技术的心理学研究: 方法及应用

赶快收藏 | 社会科学文本挖掘技术资料汇总

B站社会科学文本分析视频合集

词嵌入技术在社会科学领域进行数据挖掘常见39个FAQ汇总

文本分析 | 中国企业高管团队创新注意力(含代码)

文本分析 | MD&A 信息含量指标构建代码实现

金融研究 | 使用Python构建「关键审计事项信息含量」

金融研究 | 文本相似度计算与可视化

转载 | 社会计算驱动的社会科学研究方法

推荐 | 社科(经管)文本分析快速指南

视频分享 | 文本分析在经管研究中的应用

转载 | 金融学文本大数据挖掘方法与研究进展

转载 | 大数据驱动的「社会经济地位」分析研究综述

使用 Word2Vec 和 TF-IDF 计算五类企业文化

如何用「图嵌入」将企业、高管职业经历表征为向量数据

JM2022综述 | 黄金领域: 为营销研究(新洞察)采集网络数据

MS | 使用网络算法识别创新的颠覆性与否

认知的测量 | 向量距离vs语义投影

Asent库 | 英文文本数据情感分析

PNAS | 文本网络分析&文化桥梁Python代码实现

PNAS | 使用语义距离测量一个人的创新力(发散思维)得分

PNAS | 历史文本中的语言积极性反映了动态的环境和心理因素(含Python代码)

tomotopy | 速度最快的LDA主题模型

数据集 | cctv新闻联播文稿数据

数据集 | 睡前消息文稿数据集

EDGAR | 25年数据的预训练词向量模型(含代码)

2G数据集 | 80w知乎用户问答数据

采购合同数据集 | 政府采购何以牵动企业创新

借助chatGPT更高效地学习Python文本分析

可视化99-21年地方政府报告关键词变化趋势

word_in_context | 查看某类词的上下文,更好的理解文本数据

继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存